AI资讯新闻榜单内容搜索-LLaMA

两个AI关小黑屋：Llama3.1把Claude Opus聊自闭了

把Llama 3.1 405B和Claude 3超大杯Opus双双送进小黑屋，你猜怎么着——

来自主题: AI资讯

9031 点击 2024-08-11 17:16

Llama 3.1刚发布不久，Llama 4已完全投入训练中。这几天，小扎在二季度财报会上称，Meta将用Llama 3的十倍计算量，训练下一代多模态Llama 4，预计在2025年发布。

来自主题: AI技术研报

7499 点击 2024-08-05 15:25

如今一场席卷人工智能圈的“石油危机”已经出现，几乎每一家AI厂商都在竭力寻求新的语料来源，但再多的数据似乎也填不满AI大模型的胃口。更何况越来越多的内容平台意识到了手中数据的价值，纷纷开始敝帚自珍。为此，“合成数据”也成为了整个AI行业探索的新方向。

来自主题: AI资讯

7572 点击 2024-08-05 12:23

DeepMind最近被ICML 2024接收的一篇论文，完完全全暴露了他们背靠谷歌的「豪横」。一篇文章预估了这项研究所需的算力和成本，大概是Llama 3预训练的15%，耗费资金可达12.9M美元。

来自主题: AI技术研报

7703 点击 2024-08-03 15:03

Llama 3.1 刚刚发布，你是否已经尝试了呢？就算你的个人计算机是最近的顶尖配置，运行其中最小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率，研究者想出了多种多样的方法，但其中很多都会让模型牺牲一些准确度。

来自主题: AI技术研报

8742 点击 2024-08-02 16:07

单卡搞定Llama 3.1（405B），最新大模型压缩工具来了！

来自主题: AI技术研报

10299 点击 2024-08-02 14:26

是时候用CPU通用服务器跑千亿参数大模型了！

来自主题: AI资讯

7860 点击 2024-08-01 16:19

最近一段时间开源大模型市场非常热闹，先是苹果开源了70亿参数小模型DCLM，然后是重量级的Meta的Llama 3.1 和Mistral Large 2相继开源，在多项基准测试中Llama 3.1超过了闭源SOTA模型。不过开源派和闭源派之间的争论并没有停下来的迹象。

来自主题: AI资讯

7036 点击 2024-08-01 11:26

AI大神李沐老师时隔1年多，终于回归B站“填坑”经典论文精读系列了！

来自主题: AI资讯

10446 点击 2024-07-31 16:46

Meta、UC伯克利、NYU共同提出元奖励语言模型，给「超级对齐」指条明路：让AI自己当裁判，自我改进对齐，效果秒杀自我奖励模型。

来自主题: AI技术研报

8989 点击 2024-07-31 16:05